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摘 要 同一 个 道德 决策 情景 使 用 外 语 ( 相 比 母语 ) 呈现 时 ， 个 体会 表现 出 更 强 的 功利 性 倾向 ， 
即 道德 外 语 效应 。 随 着 研究 的 深入 ， 结 论 并 不 一 致 。 本 研究 运用 元 分 析 方法 首次 探讨 了 语言 
类 型 (母语 vs. 外 语 ) 对 道德 判断 中 功利 性 倾向 的 影响 ， 并 分 析 了 相关 的 调节 变量 。 通 过 文 
献 检 索 及 梳理 ， 共 有 19 篇 文献 46 个 独立 样本 97 个 效应 量 符合 元 分 析 标 准 (N = 9672)。 结 
果 显 示 存 在 较 小 但 稳定 的 道德 外 语 效应 (g = 0.23); 调节 效应 分 析 表 明 ， 道 德 外 语 效 应 受 故 
事 类 型 的 影响 ， 在 个 人 道德 两 难 故事 中 存在 较 小 但 稳定 的 外 语 效应 (g = 0.32)， 但 在 非 个 人 
道德 两 难 故事 (g=0.11) 与 日 常 道德 评价 故事 中 (g= 0.12) 不 存在 外 语 效应 ; 非 个 人 道德 两 
难 故事 中 的 外 语 效应 受 记分 方式 的 影响 ， 多 点 记分 在 该 故事 类 型 下 存在 效应 (g = 0.27)， 二 
点 记分 不 存在 效应 (g = 0.05); 性 别 和 语系 类 型 没有 显著 的 调节 效应 。 这 些 结果 表明 语言 类 
© 型 对 个 体面 对 道德 困境 时 的 选择 倾向 有 一 定 程度 的 影响 , 道德 故事 类 型 和 记分 方式 在 未 来 的 
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当 个 体面 临风 险 决策 ， 需 要 在 两 个 描述 损失 的 选项 中 做 出 选择 时 ， 会 倾向 于 风险 寻求 ， 
选择 风险 较 大 的 选项 ; 当 个 体 需要 在 两 个 描述 收益 的 选项 中 做 出 选择 时 , 会 倾向 于 风险 规避 ， 
选择 风险 较 小 的 选项 ， 此 现象 被 称 为 框架 效应 (Tversky & Kahneman, 1981); 但 是 ， 当 同样 的 
问题 用 外 语 呈 现时 ， 相 较 于 母语 条 件 , 被 试 的 选择 并 未 呈现 出 框架 效应 ， 即 个 体 的 决策 偏差 
降低 ， 这 一 现象 被 称 为 外 语 效应 ( 关 旭 等 , 2017; 张 诗 容 ， 胡平 , 2017; Keysar et al., 2012)。 之 
后 , 有 研究 者 在 道德 判断 领域 也 发 现 了 该 效应 (Costa etal.,2014)。 当 我 们 面临 道德 两 难 困 境 ， 
例如 需要 杀 死 1 个 “胖子 ”拯救 5 个 人 时 , 个 体 更 倾向 于 无 所 作为 ; 但 当 同 一 困境 也 用 外 语 
呈现 时 ， 相 较 于 母语 条 件 ， 被 试 更 倾向 于 杀 死 “胖子 ”挽救 5 个 人 ， 即 个 体 决 策 结果 更 具有 
功利 性 倾向 。 外语 效 应 在 风险 决策 领域 与 道德 判断 领域 的 表现 有 所 不 同 : 风险 决策 领域 中 所 
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呈现 的 外 语 材 料 让 个 体 更 倾向 于 做 出 理性 的 判断 ; 而 道德 判断 领域 中 所 呈现 的 外 语 材料 让 个 
体 更 倾向 于 做 出 功利 性 的 判断 ,有 研究 专门 提出 了 将 道德 困境 中 所 展示 的 外 语 效应 称 为 “ 道 
德 外 语 效应 ”(Cipolletti et al., 2016). 

需要 强调 的 是 ， 在 这 一 系列 有 关 道 德 外 语 效应 的 研究 中 , 个 体 习 得 外 语 的 年 龄 较 晚 ，12 
SEH, 习 得 形式 主要 在 课堂 教学 环境 (高 园 园 ,2017; 张 诗 容 ， 胡 平 ,2017; Pavlenko, 2012). 
此 外 ， 在 本 元 分 析 中 的 46 个 独立 样本 中 ， 有 17 个 样本 的 被 试 ， 相 较 于 本 国 ， 外 语 国 家 具有 
更 高 的 社会 经 济 发 展 水 平 (如 汉语 与 英语 ,印度 语 与 英语 ); 而 剩 下 29 个 样本 的 被 试 , 本 国 和 
外 语 国家 具有 相似 的 社会 经 济 发 展 水 平 ( 如 法 语 与 德语 ， 法 语 与 英语 )。 


“道德 外 语 效应 ”被 发 现 以 来 (Costa et al., 2014)， 很 多 研究 者 发 现 了 显著 的 效应 ( 林 蓝 
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菲 ， 高 华 , 2020; Cipolletti et al., 2016; Corey et al., 2017; Geipel et al., 2015a, 2015b, 2016; 


Hadjichristidis et al., 2015; Hayakawa et al., 2017)， 但 也 有 相当 数量 的 实验 没有 重复 出 外 语 效 


应 (Bialek et al., 2019; Brouwer, 2019; Cavar & Tytus, 2017; Driver, 2020; Dylman & Champoux- 
Larsson, 2020)， 即 该 效应 是 否 稳定 存在 争议 ， 是 否 有 重要 的 调节 变量 还 需要 进一步 的 探讨 
(Hayakawa et al., 2016; Polonioli, 2018)。 元 分 析 方 法 可 以 整合 多 项 有 关 道 德 判断 领域 中 外 语 
效应 的 实证 研究 成 果 ， 以 有 效 避 免 单一 研究 结果 中 存在 的 抽样 及 测量 误差 (Thacker 1988); 
同时 , 对 大 量 实证 结果 的 系统 回顾 和 调节 变量 检验 , 有 利于 准确 把 握 能 调节 道德 外 语 效 应 的 
重要 变量 (Higgins & Thompson, 2002; Polonioli, 2018)。 本 研究 首次 使 用 元 分 析 的 方法 考察 道 
德 外 语 效应 的 强度 , 也 进一步 探究 了 哪些 因素 可 以 调节 该 效应 的 强 弱 , 对 回答 现 阶段 该 领域 
存在 的 争议 、 指 导 未 来 实证 研究 具有 启发 意义 。 

本 文 首先 对 道德 外 语 效 应 的 内 部 机 制 和 稳定 性 进行 了 介绍 , 并 梳理 了 可 能 调节 该 效应 的 
变量 ;其 次 ， 对 近 10 年 的 相关 文献 进行 了 元 分 析 ， 包 括 异 质 性 、 发 表 偏差 检验 ， 以 及 主 效 
应 和 和 调节 效应 分 析 ; 最 后 ,结合 已 有 证 据 对 主 效应 和 调节 效应 进行 了 深入 讨论 ， 并 对 未 来 
究 进行 了 展望 。 

2 道德 外 语 效应 

在 道德 判断 任务 中 , 语言 类 型 会 影响 被 试 的 判断 结果 。 当 天 桥 版 本 的 电车 困境 用 外 语 呈 
现时 ， 相 比 于 母语 ， 被 试 更 倾向 于 做 出 功利 性 选择 ， 即 牺牲 1 个 人 拯救 5 个 人 (Costa et al., 
2014)。 但 道德 两 难 故事 更 多 是 反映 个 体 哲学 范畴 上 的 道德 倾向 ， 为 使 道德 判断 更 加 贴近 现 
实情 境 ， 研 究 者 将 日 常生 活 的 不 道德 行为 作为 判断 材料 ， 发 现在 外 语 条 件 下 ， 被 试 对 不 道德 
行为 的 宽容 度 更 高 (Geipel et al., 2015b)。 在 此 基础 上 ， 同 批 研究 者 将 道德 判断 的 实验 材料 进 
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因此 会 耗费 更 多 的 时 间 进 行 决 策 , 使 个 体 更 倾向 于 功利 论 的 判断 ( 喻 丰 等 , 2011); 而 直觉 式 的 
情绪 加 工 基 于 道德 直觉 过 程 ， 依 赖 于 启发 式 的 、 情 绪 驱 动 及 经 验 联 乡 
2011); 该 加 工 过 程 不 需要 投入 过 多 的 认 知 资源 、 


判断 ， 使 个 体 更 倾向 于 道义 论 的 判断 (Kahneman & Frederick, 2002)。 研 究 还 发 现 ， 情 绪 是 影 
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响 个 体 进行 道德 决策 的 重要 心理 机 制 ( 胡 艺 世 等 , 2018; Moll & de Oliveira-Souza, 2007), “4 


道德 决策 过 程 由 直觉 式 加 工 主 导 时 , 个 体 可 能 会 唤起 更 强烈 的 情绪 反应 ; 反之 ， 当 分 析 式 加 


工 在 道德 决策 中 占 主导 时 ， 被 试 唤起 的 情绪 反应 较 弱 。 而 外 语 对 个 体 情绪 反应 的 减弱 作用 
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2004; Puntoni et al., 2009)。 对 被 试 生理 反应 的 观测 同样 得 到 了 一 致 的 结论 (Harris et al., 2003, 


2006)。 基 于 道德 判断 的 “ 双 加 工 ” 理 论 ， 结合 语言 类 型 对 情绪 的 影 
部 机 制 有 如 下 解释 : 分 析 式 加 工 理论 认为 , 阅读 外 语 需要 调 | 
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加 谨慎 ， 从 而 导致 被 试 更 注 章 “最 多 救 几 个 ” 


2014)。 进 一 步 研 究 发 现 ， 相 较 于 母语 ， 外 语 呈 现 的 同一 事件 
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利 性 的 选择 结果 ( 关 旭 等 , 2017; Geipel et al., 2015a)。 


2.2 道德 外 语 效应 是 否 稳定 存在 ? 
研究 者 们 通过 “ 双 加 工 ” 理 论 来 解释 出 现 


加 工 。 但 支持 直觉 式 加 工 的 Hadjichristidis 等 人 (2015) 的 研究 指 


电 时 ， 其 自动 化 过 程 被 弱化 ,进而 更 倾向 于 功 
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互 对 立 的 ， 更 多 是 反应 个 体 不 同 的 加 工 倾向 ， 


等 , 2017; 尹 军 等 , 2018)。 而 这 种 对 于 道德 判断 的 加 
站， 倾向 于 分 析 式 加 工 的 个 体会 更 加 主动 的 调动 认 知 资源 理解 故事 、 权 衡 不 同 结果 的 利 浆 ， 
更 加 审慎 的 处 理 故事 信息 ,进而 更 关注 结果 最 大 化 的 选择 , 即 功利 性 
觉 式 加 工 的 个 体 ， 在 到 


et al., 2014; Geipel et al., 2015b); 而 倾向 于 ] 


“ 双 加 工 ” 理 论 并 非 相 


从 而 导致 对 于 道德 两 难 故事 的 决策 差异 ( 关 烛 


工 倾向 是 受 语言 类 型 影响 的 ， 外语 条 件 


选项 (入 军 等 , 2018; Costa 


E 解 外 语 呈 现 的 故事 时 难 


以 自动 化 的 处 理 信息 ,情绪 反应 被 弱化 ， 对 于 故事 中 受害 者 的 共 情 程度 更 低 ， 为 此 更 少 选择 
道义 论 选项 (Geipel et al., 2015a; Hayakawa et al., 2017)。 基 于 以 上 论述 ， 出 现 了 道德 外 语 效 应 
的 研究 中 ,不 论 个 体 倾 向 于 何 种 信息 加 工 方式 ， 面 对 外 语 呈 现 的 道德 决策 情境 时 ， 其 信息 加 
工 的 结果 是 趋 于 一 致 的 ， 即 外 语 条 件 下 , 个 体 在 道德 判断 中 更 倾向 于 功利 性 的 决策 结果 。 而 
这 种 倾向 的 稳定 性 很 可 能 基于 双语 条 件 下 , 个 体 情 绪 唤醒 水 平 存在 差异 的 稳定 证 据 。 而 在 未 
重复 出 道德 外 语 效应 的 实验 中 , 研究 者 们 也 发 现 了 影响 该 效应 稳健 性 的 其 它 因素 , 这 些 因素 
般 也 与 个 体 情绪 唤醒 有 关 : 如 绝 大 部 分 研究 只 在 个 人 道德 两 难 故事 中 发 现 了 语言 类 型 的 影 
响 ， 而 不 同类 型 的 故事 具有 不 同 的 自我 卷 入 度 ， 进 而 导致 情绪 反应 的 差异 (Costa et al., 2014; 
Geipel et al., 2015a, 2016; Shin & Kim, 2017)。 也 有 研究 发 现 ， 当 个 体外 语 的 熟练 程度 较 高 ， 
也 难以 观察 到 外 语 效应 ， 这 可 能 是 由 于 双语 情绪 反应 的 差异 随 语 言 熟练 度 的 提升 而 减弱 
(Wong & Ng,2018)。 还 有 研究 者 从 语言 文化 相似 性 的 角度 切入 ， 发现 双语 间 文 化 相似 性 越 高 
的 群体 越 不 存在 语言 类 型 的 效应 , 对 此 可 能 的 解释 是 文化 相似 性 会 影响 双语 情绪 唤醒 水 平 的 
差异 ， 使 不 同 语言 条 件 下 被 试 的 情绪 反应 相近 ， 进 而 导致 道德 决策 结果 的 倾向 性 没有 差异 
(Cavar & Tytus, 2017; Dylman & Champoux-Larsson, 2020)。 综 上 ， 道 德 外 语 效 应 的 稳健 性 与 
双语 条 件 下 个 体 情绪 反应 的 差异 息息相关 , 但 由 于 该 效应 也 受 其 它 因 素 的 干扰 , 语言 类 型 的 
影响 程度 可 能 较为 有 限 ( 倪 传 斌 , 2020);， 所 以 ， 我 们 既 要 重视 但 又 不 能 夸大 语言 类 型 的 单独 
影响 。 由 此 ， 本 研究 提出 假设 1: 语言 类 型 对 道德 判断 中 的 功利 性 倾向 存在 一 定 程度 的 稳定 


2.3 道德 外 语 效 应 的 调节 变量 

Pr 自 道德 外 语 效应 被 发 现 以 来 , 研究 者 们 开展 了 广泛 的 有 关 其 稳健 性 及 影响 因素 的 相关 研 
究 , 但 是 研究 结果 不 尽 相 同 , 仍 存在 相当 数量 的 部 分 研究 没有 重复 出 道德 外 语 效应 ， 这 让 研 
究 者 对 其 稳健 性 提出 质疑 。 基 于 文献 梳理 , 我 们 认为 道德 外 语 效应 的 稳定 性 可 能 与 选用 的 故 

事 类 型 、 研 究 对 象 的 性 别 、 结 果 的 记分 方式 及 双语 间 的 语系 类 型 等 因素 有 关 。 

2.3.1 故事 类 型 

故事 类 型 可 能 调节 道德 外 语 效应 。 有 研究 者 发 现 , 道德 外 语 效应 并 非 稳 定 出 现在 所 有 的 
道德 两 难 故事 中 , 天 桥 版 本 的 电车 困境 (是 否 亲自 推 下 一 个 人 ) 相 较 于 转换 版 本 的 电车 困境 (是 
a 


变换 轨道 ) 更 容易 观察 到 语言 类 型 的 影响 (Corey et al., 2017; Geipel et al., 2015a). 以 上 两 种 


版 本 的 电车 困境 根据 决策 者 施加 伤害 行为 的 个 人 卷 入 程度 存在 一 个 明确 的 划分 , 即 个 人 道德 
两 难 故事 与 非 个 人 道德 两 难 故事 (Moore et al., 2011)。 这 两 种 故事 类 型 的 区 别 在 于 ,决策 者 是 
否 对 受害 者 施加 了 直接 的 伤害 行为 ， 如 天 桥 困 境 杀 自 推 人 阻止 电车 便 是 个 人 道德 两 难 困境 ， 
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而 电车 困境 仅仅 转动 开关 阻止 电车 便 是 非 个 人 道德 两 难 困 境 。 个 人 道德 两 难 故事 强调 行为 的 
主动 性 与 直接 性 、 更 易 唤 醒 情 绪 反 应 ， 非 个 人 道德 两 难 困境 强调 行为 的 间接 性 、 情 绪 唤 醒 水 
平 更 低 ， 而 外 语 可 以 显著 减弱 个 体 的 情绪 反应 (Dewaele, 2004; Pavlenko, 2004)。 由 此 推断 ， 
个 人 道德 两 难 故 事 相 较 于 非 个 人 道德 两 难 故事 ,其 情绪 唤醒 程度 更 易 受 语言 类 型 的 影响 , 进 
而 更 易 出 现 决 策 结果 的 偏差 。 研究 结果 也 表明 , 一 般 在 个 人 道德 两 难 困境 中 观察 到 的 外 语 效 
应 较为 稳定 , 因为 该 情境 被 试 的 自我 卷 入 程度 更 高 , 在 母语 条 件 下 更 容易 引发 强烈 的 冲突 情 
绪 ， 而 外 语 对 于 情绪 的 弱化 作用 ， 导 致 不 同 语言 条 件 下 情绪 唤醒 的 差异 ， 进 而 造成 决策 结 
的 不 同 (Geipel et al., 2016; Hadjichristidis et al., 2017; Hayakawa et al., 2017)。 在 非 个 人 道德 两 
难 故事 中 被 试 自 我 卷 入 程度 不 高 ， 由 此 不 论 何 种 语言 条 件 下 ， 被 试 的 情绪 反应 差异 不 大 。 综 
上 ， 本 研究 提出 假设 2: 故事 类 型 能 够 对 道德 外 语 效 应 起 调节 作用 。 
2.3.2 性 别 
性 别 可 能 调节 道德 外 语 效应 。 首 先 ， 从 共 情 的 性 别 差异 分 析 : 生理 层面 上 ， 催 产 素 有 助 
于 情绪 共 情 ， 而 睾酮 则 与 认 知 共 情 有 负 相 关 ， 两 性 的 共 情 水 平 也 由 此 存在 差异 ; 性 别 角 色 层 
面 上 , 当 两 性 习 得 各 自 的 性 别 角色 以 后 , 其 在 情绪 共 情 方面 的 差异 较为 突出 ( 陈 武 英 等 ,2014)。 
因此 , 面 对 同一 道德 两 难 困 境 , 女性 相 较 于 男性 对 故事 中 的 受害 者 可 能 存在 更 高 水 平 的 共 情 ， 
诱发 更 多 的 负 性 情绪 ， 进 而 对 决策 结果 产生 影响 。 其 次 ， 从 情绪 调节 来 看 ， 女 性 对 于 负 性 情 
绪 的 调控 效果 不 如 男性 ， 男 性 更 善于 利用 抑制 情绪 的 方式 对 负 性 情绪 进行 日 常 管理 ( 蔡 阿 燕 
等 , 2016)。 此 外 ， 道 德 规范 敏感 性 的 性 别 差异 可 能 来 源 于 举 酮 分 泌 水 平 的 性 别 差异 ( 曾 笑 雨 ， 
马 儿 娜 ,2020)。 因 此 ， 相 较 于 男性 ， 女 性 面 对 相 同 的 道德 两 难 困境 时 ， 对 负 性 情绪 进行 抑制 
调控 的 难度 更 大 ， 进 而 更 倾向 于 道义 论 选择 。 综 上 ， 本 研究 提出 假设 3: 性 别 能 够 对 道德 外 
语 效 应 起 调节 作用 。 
2.3.3 记分 方式 
结果 的 记分 方式 也 可 能 会 对 道德 外 语 效 应 产生 影响 ,对 本 次 纳入 元 分 析 的 文献 进行 梳理 
可 知 ， 研 究 者 使 用 的 结果 记分 方式 存在 差别 ， 主 要 存在 二 点 记分 (“是 ”选项 或 “ 否 ” 选 项 ) 


与 多 点 记分 (询问 牺 和 


值 大 小 依 | 


FE 无 率 者 的 意愿 程度 ) 两 大 类 ， 研 究 者 通过 不 同 的 记分 方式 ， 获 得 的 效应 


日 存在 差异 (Geipel et al., 2015a)。 例 如 ，Geipel 等 人 (2015a) 的 研究 结果 显示 ， 在 天 


桥 版 本 的 电车 困境 中 利用 二 点 记分 获得 的 结果 刚刚 达到 显著 的 标准 ， 其 等 价 的 效应 量 4 为 
0.32， 而 相同 的 实验 程序 利用 多 点 记分 获得 的 等 价 效应 量 d 为 0.95。 根 据 效应 值 4 的 划分 标 
准 (Cohen, 1992)， 二 点 记分 获得 的 语言 效应 属于 较 小 的 效应 值 ， 而 多 点 记分 获得 的 结果 属于 
较 大 的 效应 值 ， 多 点 记分 可 能 比 二 点 记分 更 加 敏感 、 更 易 获 得 较 大 的 效应 量 。 这 可 能 是 由 于 


二 点 记分 方式 的 选项 呈现 较为 单一 , 更 关注 个 体 对 于 道德 两 难 困 境 的 结果 而 不 重视 对 某 种 决 
策 结果 的 倾向 性 程度 。 而 多 点 记分 方式 相 较 于 二 点 记分 方式 更 加 敏感 , 可 能 更 容易 捕捉 到 被 
试 在 不 同 语言 条 件 下 面 对 同 一 困境 的 某 种 倾向 性 (Geipel et al., 2015a)。 因 此 ， 本 研究 提出 假 
设 4: 记分 方式 能 够 对 道德 外 语 效应 起 调节 作用 。 
2.3.4 语系 类 型 

双语 间 的 语系 类 型 也 可 能 会 调节 道德 外 语 效应 。 语言 学 家 们 将 同 源 性 程度 较 高 、 一 般 结 
构 相 似 性 较 高 的 不 同 语言 纳入 同一 语系 (Holman et al., 2011)。 通 过 对 纳入 该 元 分 析 的 文献 梳 
理 可 知 ， 被 试 的 母语 与 外 语 一 般 可 以 归 为 : 隶属 同一 语系 或 不 同 语系 。 同 一 语系 下 的 语言 具 
有 更 高 的 结构 相似 性 , 而 当 母 语 与 外 语 的 结构 相似 性 较 高 时 , 外 语 可 以 通过 激活 母语 的 一 般 
结构 ， 进 而 获得 唤醒 水 平 较为 一 致 的 情绪 体验 (Green, 2009)。 反 之 ， 隶 属 不 同 语系 的 语言 间 
不 具有 较 高 相似 性 的 语言 结构 , 个 体 在 阅读 外 语 呈现 的 道德 困境 时 , 无 法 依托 母语 与 外 语 共 
享 的 语言 结构 或 语法 进行 故事 内 容 的 理解 或 情绪 体验 迁移 (Dylman & Barry, 2018)， 更 多 依靠 
个 体 本 身 的 外 语 水 平 ， 由 此 导致 不 同 语言 条 件 下 的 情绪 差异 。 有 研究 者 发 现 ， 当 母语 与 外 语 
间 的 语系 类 型 及 文化 交流 密切 相关 时 ， 即 使 在 个 人 道德 两 难 故事 中 也 未 观察 到 语言 效应 


(Brouwer, 2019; Cavar & Tytus, 2017; Dylman & Champoux-Larsson, 2020); 反之 ， 外 语 效 应 在 
隶属 不 同 语系 、 使 用 群体 相距 更 远 的 语言 组 合 中 更 易 出 现 (Brouwer, 2019)。 由 此 推论 ， 同 

语系 下 的 语言 由 于 其 语言 结构 的 相似 性 , 母语 与 外 语 间 的 情绪 唤醒 水 平 类 似 , 进而 双语 的 决 
策 结果 更 可 能 趋 于 一 致 ;， 反之, 不 同 语系 下 的 语言 更 易 出 现 情绪 差异 ,可 能 更 容易 观察 到 外 


语 效应 。 综 上 ， 本 研究 提出 假设 5: 语系 类 型 能 够 对 道德 外 语 效应 起 调节 作用 。 


3 研究 方法 
3.1 文献 搜集 

2012 年 ,“ 外 语 效应 ”在 风险 决策 领域 中 被 首次 提出 (Keysar etal., 2012)， 随 后 研究 者 将 
该 效应 逐渐 拓展 到 道德 判断 领域 (Costa et al., 2014), 并 不 断 验证 其 稳定 性 及 影响 因素 (Dylman 
& Champoux-Larsson, 2020)， 由 于 该 效应 从 提出 至 今 还 不 到 十 年 ， 为 此 本 研究 将 检索 时 间 跨 
度 设 为 2010 年 1 月 到 2020 年 5 月 , 涵盖 近 十 年 的 有 关 研 究 , 以 中 文 和 英文 文献 检索 方式 进 
行文 献 检 索 。 依 据 已 见 刊 的 中 英文 文献 中 题目 、 摘 要 、 关 键 词 这 三 部 分 的 高 频 词 作为 文献 检 
索 的 关键 词 。 按 照 顺 序 依 次 在 中 国 知 网 、 万 方 、 维 普 数 据 库 将 关键 词 “ 外 语 效应 ”“ 道 德 外 


语 效应 “外 语 ^“ 双 语 ”分 别 与 “道德 ^“ 道 德 判断 “道德 决策 “道德 评价 ““ 道 德 


两 难 故事 ”进行 匹配 检索 ， 搜 索 篇 名 、 关 键 词 及 摘要 包含 此 类 关键 词 的 期 刊 与 论文 。 接 着 将 


关键 词 :“foreign language effect”, “foreign language”. “bilingual”, “moral foreign language 
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effect”. “the effect of foreign language” 7} 4! 4 “morality”, “morals”, “moral decision-making”, 


“moral judgement”. “moral dilemma stories”. “moral evaluation”, 在 Web of Science 核心 合 


Z. Pub Med, Science Direct. Springer Online Journals 数据 库 中 分 别 进行 检索 ， 搜 索 篇 名 、 
关键 词 及 摘要 中 包含 此 类 关键 词 的 文献 未 发 表 的 中 文 文献 通过 中 国 优秀 硕士 学 位 论文 全 文 
数据 库 、 博 士 学 位 论文 全 文 数 据 库 进行 查找 ; 未 发 表 的 英文 文献 通过 邮件 询问 该 领域 的 主要 
究 者 和 查找 ProQuest 和 DART-Europe 硕 博 论文 数据 库 进 行 搜 集 。 
3.2 文献 纳入 与 排除 标准 

将 检索 的 文献 按照 以 下 标准 进行 筛选 : (研究 必 须 是 考察 道德 判断 中 外 语 效应 的 实证 
究 ， 数据 资料 完整 明确 ， 排 除 纯 理论 或 综述 类 文章 ; (2) 研 究 对 象 为 正常 人 群 ， 其 它 特殊 群 
本 (例如 存在 各 类 心境 障碍 的 被 试 群体 ) 需 要 被 排除 ，(3) 文 章 需 考察 道德 判断 中 的 外 语 效应 ， 
并 明确 报告 了 能 转换 成 4 值 的 灾 值 、F 值 或 1 值 ， 若 文章 未 报告 以 上 参数 则 向 作者 进一步 讨 
要 ， 讨 要 未 果 再 排除 (4) 考虑 研究 结果 异 质 性 的 问题 ， 若 研究 中 同时 存在 生理 指标 与 行为 
指标 ， 则 应 排除 生理 指标 , 保留 行为 指标 ; (5) 排 除 重复 发 表 的 文章 ， 同 一 批 数 据 反 复 使 用 的 
应 只 统计 一 次 。 最 终 纳 入 元 分 析 的 文献 共计 19 篇 ， 包括 中 文 文献 3 篇 、 英 文 文献 16 篇 ， 共 
计 97 个 效应 量 ， 文 献 检索 及 筛选 流程 图 见 图 1。 
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检索 检索 数据 库 获 得 文献 : n= 659， 
中 文 n=464 , HM n= 195 


阅读 标题 及 摘要 排除 文献 n= 465; 
排除 重复 文献 n= 133。 


Wii 初次 筛选 获得 文献 n= 61, 阅读 全 文 共计 排除 文献 n=42， 包 括 : 
PX n=24, RX n=37 综述 或 纯 理 论文 献 n= 13; 
非 道德 判断 领域 中 的 外 语 效应 n= 24; 
以 生理 指标 为 反应 的 文献 n= 1 
无 法 计算 效应 量 d 值 的 文献 n=4。 


确认 阅读 全 文 后 确认 文献 n=19 


了 次 阅读 排除 文献 n=0。 


纳入 再 次 筛选 后 获得 文献 : n = 19 
PX n=3 , XX n=16 
效应 量 个 数 k = 97 


图 1 文献 筛选 流程 图 


3.3 文献 编码 

对 纳入 元 分 析 的 文献 进行 如 下 编码 : (1]) 文 献 信息 (作者 及 发 表 年 限 ); (2) 实 验 顺序 ; (3) 该 
实验 采用 的 故事 数目 ，(4) 纳 入 分 析 的 故事 次 序 /数目 ，(5) 样 本 量 ;，(6) 女 性 占 比 (%); (7) 故 事 
类 型 ，(8) 记 分 方式 ，(9) 语 系 类 型 ，(10) 效 应 值 gs。 效应 值 的 提取 遵照 以 下 标准 : (1) 由 于 一 部 
分 研究 者 在 分 析 数 据 时 , 会 依次 分 析 每 个 故事 的 效应 , 一 部 分 研究 者 会 直接 分 析 所 有 故事 的 
效应 ; 因此 ， 每 项 研究 中 独立 的 故事 编码 一 次 ， 若 存在 多 个 独立 故事 则 分 开 编码 ， 直 接 分 析 
所 有 故事 的 样本 编码 一 次 。(2) 同 一 批 数据 重复 发 表 的 文章 只 取 其 一 ， 以 期 刊 论文 为 主 。 该 研 
究 的 文献 编码 工作 由 两 位 编码 者 独立 提取 、 同 时 进行 (Borenstein et al., 2011)， 两 位 编码 者 均 
为 中 国人 民 大 学 心理 学 系 的 硕士 研究 生 , 具有 较 强 的 文献 阅读 及 统 记分 析 能 力 , 两 位 编码 者 
的 一 致 性 为 96.11%， 说 明 该 研究 的 文献 编码 比较 准确 且 有 效 。 此 外 ， 编 码 不 一 致 的 研究 也 
通过 进一步 讨论 而 达成 共识 。 最 终 纳入 元 分 析 的 文献 共计 19 篇 ， 包 括 中 文 文献 3 篇 、 英 文 
文献 16 篇 ， 共 计 97 个 效应 量 ( 表 1). 

考虑 到 本 研究 纳入 的 文献 大 部 分 设置 了 多 项 实验 、 逐 次 分 析 了 每 个 故事 的 效应 , 进而 得 
到 的 多 个 效果 量 会 占据 较 大 的 权重 ， 可 能 会 导致 结果 产生 偏差 (Borenstein et al., 2011); 同时 
传统 的 元 分 析 统 计 方 法 无 法 处 理 非 独 立 效应 量 之 间 的 相关 性 , 为 此 该 研究 将 使 用 可 处 理 
量 间 相关 的 Robust variance estimation (RVE) 统 计 方 法 ， 并 与 传统 的 元 分 析 结 果 进 行 对 比 ， 进 
而 了 解 多 个 非 独 立 效应 量 之 间 的 相关 性 对 该 研究 结果 的 影响 (Fisher & Tipton, 2015). 

表 1 纳入 分 析 的 原始 研究 的 基本 资料 


TH 


效应 


由 


文献 ce ee ea 故事 类 型 =a WAM 。 效应 值 

: 顺序 数目 事 次 序 / 数 5 EE (%) 
“¢ jE, 2020 Exp.1 4 1/1 44 61.37 常 道德 评价 故事 多 点 记分 。 ”不 同 语系 0.048 
g 2/1 44 61.37 常 道 德 评价 故事 多 点 记分 不 同 语系 0.008 
3/1 44 61.37 常 道德 评价 故事 多 点 记分 不 同 语系 -0.117 
4/1 44 61.37 常 道德 评价 故事 多 点 记分 不 同 语系 -0.289 
胡 宏 安 , 2019 Exp.1 8 1-8/8 74 50.00 非 个 人 道德 两 难 故 事 ”多 点 记分 不 同 语系 0.199 
Exp.2 8 1-8/8 70 50.00 个 人 道德 两 难 故事 多 点 记分 不 同 语系 1.181 
关 旭 , 2017 Exp.1 8 1-8/8 62 100.00 个 人 道德 两 难 故 事 二 点 记分 不 同 语系 1.126 
Exp.2 8 1-8/8 62 100.00 个 人 道德 两 难 故 事 二 点 记分 不 同 语系 -0.043 
Exp.3 8 1-8/8 62 100.00 个 人 道德 两 难 故事 二 点 记分 不 同 语系 -0.087 
Hong Im Shin & Exp.1 4 1/1 161 67.08 非 个 人 道德 两 难 故事 ”二 点 记分 不 同 语系 0.265 
Juyoung Kim, 2017 2/1 161 67.08 非 个 人 道德 两 难 故事 ”二 点 记分 不 同 语系 0.166 
3/1 161 67.08 个 人 道德 两 难 故 事 二 点 记分 不 同 语系 -0.820 
4/1 161 67.08 个 人 道德 两 难 故事 二 点 记分 不 同 语系 0.417 
Alexandra S. Exp.2a 1 1/1 198 83.84 个 人 道德 两 难 故事 二 点 记分 司 一 语系 -0.132 
Dylmana, & Marie- 1/1 175 84.00 个 人 道德 两 难 故事 二 点 记分 司 一 语系 -0.451 
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多 点 记分 
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二 点 记分 
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多 点 记分 
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多 点 记分 
多 点 记分 
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0.069 
0.064 
0.557 
0.716 
0.135 
0.401 

0.330 
0.016 
0.963 
0.511 

0.152 
0.484 
0.295 
0.196 
0.196 
-0.155 
-0.866 
1.516 
0.000 
0.654 
0.165 
0.541 
-0.355 
0.881 

0.695 
0.290 
0.368 
0.035 
0.011 
-0.165 
0.003 
-0.363 
0.003 

0.132 
0.008 
-0.128 
0.530 
0.299 
0.281 

0.531 

0.299 
0.420 
0.461 

0.373 


Rafal Muda et al., Exp.1 20 
2018 
Albert Costa et al., Exp.1 1 
2014 Exp.2 2 
Joanna D. Corey et Exp.la 2 
al., 2017 
Exp.1b 2 
Exp.2a 2 
= 
LO Exp.2b 2 
O Exp.3a 2 
= 
N Exp.3b 2 
= 
N Exp.3c 2 
EË Exp.3d 2 
= 
x< Exp.3e 2 
i ee Cipolletti et Exp.1 2 
($) al., 2016 
Janet Geipel, Exp.la 4 
Constantinos Exp.1b 4 
Hadjichristidis et al., Exp.2 4 
2015 4 
Exp.3 4 
Janet Geipel et al., Exp.1 3 
2016 Exp.2 2 
Yuen-Lai Chan et al., Exp.1 39 
2016 


条 时 ， 加 入 第 二 作者 以 区 分 。 
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328 
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TE: 元 分 析 文 献 作 者 在 两 人 之 内 时 均 列 出 作者 名 ， 多 于 


87.11 非 个 人 道德 两 难 故事 ”多 点 记分 司 一 语系 
65.00 非 个 人 道德 两 难 故 事 ”多 点 记分 司 一 语系 
65.00 个 人 道德 两 难 故 事 多 点 记分 司 一 语系 
53.00 个 人 道德 两 难 故事 二 点 记分 混合 语系 
71.92 个 人 道德 两 难 故 事 二 点 记分 司 一 语系 
71.92 非 个 人 道德 两 难 故 事 ”二 点 记分 司 一 语系 
73.00 个 人 道德 两 难 故 事 二 点 记分 司 一 语系 
71.00 个 人 道德 两 难 故 事 二 点 记分 司 一 语系 
71.00 非 个 人 道德 两 难 故 事 ”二 点 记分 司 一 语系 
73.00 非 个 人 道德 两 难 故 事 ”二 点 记分 司 一 语系 
72.54 非 个 人 道德 两 难 故 事 ”二 点 记分 司 一 语系 
72.54 个 人 道德 两 难 故 事 二 点 记分 司 一 语系 
84.00 非 个 人 道德 两 难 故 事 ”二 点 记分 司 一 语系 
84.00 个 人 道德 两 难 故 事 二 点 记分 司 一 语系 
79.95 非 个 人 道德 两 难 故事 ”二 点 记分 司 一 语系 
79.95 个 人 道德 两 难 故 事 二 点 记分 司 一 语系 
76.43 非 个 人 道德 两 难 故事 ”二 点 记分 司 一 语系 
76.43 个 人 道德 两 难 故事 二 点 记分 司 一 语系 
73.05 非 个 人 道德 两 难 故事 ”二 点 记分 司 一 语系 
73.05 个 人 道德 两 难 故 事 二 点 记分 司 一 语系 
70.47 非 个 人 道德 两 难 故 事 ”二 点 记分 司 一 语系 
70.47 个 人 道德 两 难 故 事 二 点 记分 司 一 语系 
51.36 非 个 人 道德 两 难 故事 ”二 点 记分 司 一 语系 
51.36 个 人 道德 两 难 故 事 二 点 记分 司 一 语系 
67.00 非 个 人 道德 两 难 故 事 ”二 点 记分 司 一 语系 
67.00 个 人 道德 两 难 故事 二 点 记分 司 一 语系 
83.48 非 个 人 道德 两 难 故 事 ”二 点 记分 司 一 语系 
83.48 个 人 道德 两 难 故事 二 点 记分 司 一 语系 
76.25 非 个 人 道德 两 难 故 事 ”二 点 记分 司 一 语系 
76.25 个 人 道德 两 难 故 事 二 点 记分 司 一 语系 
70.83 多 点 记分 同一 语系 
87.50 多 点 记分 司 一 语系 
78.21 常 道德 评价 故事 多 点 记分 司 一 语系 
78.21 常 道德 评价 故事 多 点 记分 司 一 语系 
90.54 常 道 德 评 价 故 事 多 点 记分 司 一 语系 
73.83 常 道德 评价 故事 多 点 记分 司 一 语系 
70.14 常 道德 评价 故事 多 点 记分 司 一 语系 
52.08 未 区 分 故事 类 型 二 点 记分 不 同 语系 
人 时 只 列 出 第 一 作者 ; 当 同 年 度 同 作者 文献 有 两 


0.282 
-0.073 
0.901 
0.298 
0.585 
0.013 
0.521 
0.641 
-0.072 
-0.033 
0.470 
0.324 
-0.360 
0.000 
-0.092 
-0.040 
-0.095 
-0.124 
0.073 
0.642 
0.334 
0.426 
0.458 
0.279 
0.423 
0.069 
0.410 
0.161 
-0.073 
0.692 
0.716 
0.553 
0.511 
0.042 
0.666 
0.168 
-0.369 
0.143 


3.4 元 分 析 过 程 
3.4.1 效应 量 计算 

元 分 析 以 标准 化 均 数 差 Hedge’sg， 即 Cohen’s d 的 修正 量 作为 道德 判断 中 外 语 效应 的 效 
果 量 (Vellestad et al., 2012). Hedge’s g 相 较 于 Cohen’s d 可 以 提供 更 精确 的 估计 ， 尤 其 是 在 
小 样本 数据 时 ; 虽然 两 者 的 计算 方式 存在 些许 差异 , 但 其 大 小 划分 是 一 致 的 (Goulden & Keith, 
2006)。 搜 集 文献 中 报告 的 效应 值 4 后 ， 通 过 以 下 公式 进行 转化 : g=4d[1-(3/(44df-1))], df 
=n1+n2-2。 若 纳入 的 研究 未 报告 效应 值 4， 则 根据 样本 量 、 平 均 数 和 标准 差 等 原始 数据 进 
行 计算 : 4 = (M1 -M2) / spooled， Spooled = [(n1 — 1) s1? + (m - 1) s2 / m +m- 2]. AAA KI 
REM A OPE. PEREA A A Ay 2 RER E 7° E 
FIER t EHITAME: d=2[ 7 /(N-Y)]'?s d=2[F (m +m)/nn]?; d=t(nt+m 


/ nim)! 
3.4.2 模型 的 选 定 

元 分 析 基 本 从 固定 效应 模型 (fixed effects model) 或 随机 效应 模型 (random effects model) F 
选择 一 种 进行 综合 效应 的 估计 。 固定 效应 模型 预 设 研究 间 的 差异 只 由 随机 误差 导致 , 不 同 研 
究 间 的 真实 效应 值 是 相同 的 ; 而 随机 效应 模型 假设 不 同 研究 间 的 真实 效应 值 可 以 不 一 致 ， 除 
了 随机 误差 ， 研 究 群体 、 研 究 范 式 等 因素 也 会 导致 研究 间 的 差异 (Borenstein etal., 2011)。 本 
研究 梳理 文献 发 现 ， 道 德 外 语 效 应 可 能 受 性 别 比例 、 故 事 类 型 和 记分 方式 等 因素 的 调节 ， 因 
而 采用 随机 效应 模型 进行 元 分 析 。 此 外 ,利用 异 质 性 检验 可 以 进一步 验证 模型 选择 的 适 切 性 ， 
其 中 包括 O 检验 与 尸检 验 。O RAPE p< 0.05 则 结果 异 质 ; 检验 对 异 质 性 程度 进行 划 
分 ， 对 高 、 中 、 低 、 无 异 质 性 的 分 界 取 值 分 别 为 75%、50% 与 25% (Higgins etal., 2003). # 
0 检验 结果 不 显著 或 了 呈现 低 异 质 性 , 则 考虑 固定 效应 模型 反之 , 该 研究 更 适合 随机 效应 
模型 。 
3.4.3 发 表 偏 差 

当 已 见 刊 的 文献 未 能 全 面 系统 的 代表 该 研究 领域 的 全 貌 时 ， 就 说 明 出 现 了 发 表 偏 差 
(Rothstein et al., 2005)。 发 表 偏 差 导致 已 见 刊 的 文献 中 阳性 结果 远 高 于 阴性 结果 ， 这 将 使 元 
分 析 结 果 出 现 重 大 偏差 ， 进 而 导致 获得 的 效应 值 高 于 真实 值 (Kuppens et al., 2013)。 针 对 发 表 
偏差 的 问题 ， 在 文献 搜集 阶段 便 要 尽 可 能 检索 未 发 表 的 文章 ; 还 应 在 之 后 的 分 析 中 ,通过 漏 
斗 图 (funnel plot), Egger’s 回归 检验 、Classic Fail-safe N 值 ( 失 安全 系数 ) 和 p-curve 技术 来 检 
验 发 表 偏差 。 漏 斗 图 是 将 各 研究 的 效应 量 转化 成 可 视 化 的 散 点 图 ， 是 一 种 主观 评价 的 方式 ， 
若 不 存在 发 表 偏差 ， 数 据 应 左右 对 称 分 布 、 集 中 在 中 上 部 。Egger's 回归 的 结果 不 显著 ， 则 


认为 不 存在 发 表 偏差 (Egger et al., 1997). Classic Fail-safe N 值 ( 失 安全 系数 ) 表 示 使 研究 失去 
统计 学 意义 还 需要 纳入 多 少 个 研究 ， 当 该 值 大 于 5k + 10(k 为 效应 量 个 数 ) 时 ， 说 明 不 存在 显 
著 的 发 表 偏差 (Rothstein etal., 2005). p-curve 检验 中 如 果 某 研究 是 存在 效应 的 ， 那 么 应 该 出 
现 右 偏 态 的 p 值 分 布 ， 否 则 ， 可 能 存在 发 表 偏差 (Simonsohn et al., 2015). 

3.4.4 数据 处 理 及 分 析 程 序 


利用 R 语言 的 metafor 和 robumeta FE) 


包 进 行 元 分 析 的 异 质 性 检验 、 发 表 偏差 检验 、 
主 效应 检验 及 调节 效应 检验 (Fisher & Tipton, 2015; Schwarzer, 2007; Viechtbauer, 2010)， 其 中 
调节 效应 检验 包括 亚 组 分 析 与 元 回归 分 析 。 亚 组 分 析 将 检验 分 类 变量 的 调节 作用 ， 如 : 故事 
类 型 、 记 分 方式 和 语系 类 型 ;元 回归 分 析 将 检验 连续 变量 的 调节 作用 ， 如 : 女性 占 比 。 若 调 
节 效 应 不 显著 则 使 用 JASP 0.13.1 进行 贝 叶 斯 因子 估计 ， 分 析 该 结果 是 否 支 持 零 假 设 。 由 于 
传统 的 Meta 分 析 在 固定 效应 模型 或 随机 效应 模型 的 前 提 下 , 利用 O 检验 计算 各 研究 间 的 差 
异 ， 该 方法 基于 正 态 分 布 的 假设 ， 因 此 当 难 以 符合 正 态 分 布 、 存 在 小 样本 资料 时 ， 传 统 方法 
分 析 受 限 ， 可 能 会 遗漏 重要 信息 (Smith etal., 1995); 而 贝 叶 斯 因子 估计 不 受 限 于 上 述 的 经 典 
统计 学 假设 , 可 以 根据 样本 信息 获得 后 验 分 布 情况 ,并 在 此 基础 上 计算 效应 值 和 研究 间 的 方 
差 ， 相 较 于 传统 方法 更 加 敏感 ， 更 不 易 遗 漏 重要 信息 (Warn etal., 2002)。 因 此 ， 在 完成 传统 
的 元 分 析 流 程 后 , 对 不 显著 的 调节 效应 结果 进行 贝 叶 斯 因子 估计 可 能 会 获得 有 价值 的 额外 信 
息 ( 张 亚 利 等 , 2019)。 为 此 该 研究 在 调节 效应 结果 不 显著 的 情况 下 ， 使 用 贝 叶 斯 因子 估计 对 


数据 资料 进行 二 次 探索 。 


ral 


4 研究 结果 
4.1 异 质 性 检验 
将 语言 类 型 对 道德 判断 中 功利 性 倾向 影响 的 元 分 析 数 据 进行 异 质 性 检验 , 2 检验 的 结 

表明 : O 值 达到 显著 水 平 ，O0oo = 344.79，p < 0.001， 说 明 本 研究 中 纳入 的 各 个 效应 量 之 间 
FERIE. 检验 的 结果 表明 ,语言 类 型 对 道德 判断 中 功利 性 倾向 影响 的 了 =72.16%， 接 
近 高 异 质 性 的 分 界 取 值 75% (Higgins et al., 2003)， 表 明 观 察 变 异 中 72.16% 是 由 效应 值 的 真 
实 差异 造成 的 ，27.84% 是 由 随机 误差 造成 的 , 表明 研究 间 的 变异 存在 组 间 误 差 干 扰 ， 各 研究 
间 存 在 较 高 异 质 性 。 综 上 ,之 后 的 元 分 析 适 合 随机 效应 模型 ， 以 上 分 析 结 果 也 暗示 ， 某 些 影 
响 因素 可 能 会 造成 研究 间 的 差异 ， 因 此 需要 对 其 中 的 调节 变量 进行 深入 分 析 。 
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4.2 发 表 偏差 检验 
漏斗 图 (图 2) 显 示 , 效应 值 主要 分 布 在 漏斗 图 的 上 方 , 左右 大 致 对 称 , 该 分 布 特点 表明 ， 

有 关 道 德 外 语 效应 的 研究 基本 不 存在 发 表 偏差 。Eggers 回归 法 的 检验 结果 不 显著 ， 表 明 该 
研究 纳入 的 效应 量 不 存在 严重 的 发 表 偏差 ， 截 距 为 -0.08, 95%CI 为 [-1.04, 0.87], p=0.862 > 
0.05 (Egger etal., 1997)。 失 安全 系数 值 (Classic Fail-safe M) 表 示 使 研究 失去 统计 学 意义 还 需要 
纳入 多 少 个 研究 ， 当 该 值 大 于 5k+ 10(k 为 效应 量 个 数 ) 时 ， 说 明 不 存在 显著 的 发 表 偏差 ， 本 
研究 的 失 安 全 系数 为 3994， 远 高 于 临界 值 495 (Rothstein et al., 2005)。p-curve 检验 结果 (图 
3) 表 明 曲 线 呈 右 偏 态 分 布 , 进一步 分 析 发 现 结果 显著 的 42 个 效应 值 具有 证 据 价值 (Z= -9.81， 
p<0.001)。 以 上 结果 表明 ， 本 研究 不 存在 严重 的 发 表 偏 差 。 
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图 2 效应 值 分 布 漏斗 图 


100% 7 观测 到 的 曲线 
检验 力 估计 : 78%, C1(65%, 8 
a 无 效应 
{ I p. 1, p 1 
一 一 一 一 33% 检 验 力 无 效 
F 坦 性 检验 : Po min > -9999, p 9999, Pima = .887 
75% 4 
x 
ka 
= 50% — 
25% 47 
0% = 
.01 .02 .03 .04 .05 
Pp 值 
注 : 观测 到 的 p 曲 线 包括 42 个 统计 上 显著 的 结果 (p < 0.05)， 其 中 33 个 p 值 低 于 0.025。 有 55 个 结果 由 于 p 值 大 于 0.05 没 有 参与 p 曲 线 检验 


图 3 p-curve 曲线 图 


4.3 主 效应 分 析 


采用 


明 语 言 类 
0.23, 95%CI 为 [0.16, 0.29]。 根 据 效应 值 q 的 划分 标准 ， 对 大 、 中 、 小 和 无 效应 量 的 分 界 取 


值 为 0.8、0.5、0.2 (Cohen, 1992)， 则 道德 外 语 效 应 的 效应 值 属于 较 小 的 效应 量 。 对 效应 量 进 


4 


行 敏 感性 


时 剔除 


随机 效应 模型 将 语言 类 型 对 道德 判断 中 功利 性 倾向 的 影响 进行 综合 性 探讨 ,结果 表 


型 对 道德 判断 中 功利 性 倾向 影响 的 主 效应 显著 ，z = 6.75, p< 0.001， 效 应 量 g 为 


分 析 ， 排 除 任意 一 个 研究 后 的 总 效应 量 g 值 在 [0.22, 0.24] 间 波动 。 根 据 森 林 图 ， 同 


项 高 异 质 性 研究 后 (Susanne Brouwer, 2019-Exp.1-5/1)， 效 应 量 g=0.22, z=6.70, p 


< 0.001。 以 上 结果 表明 ， 该 效应 值 较为 稳定 。 


为 避 


免 某 篇 文献 存在 多 个 效应 值 、 占 据 较 大 权重 , 导致 结果 偏差 (Borenstein et al., 2011); 


同时 将 基于 随机 效应 模型 的 传统 元 分 析 统 计 方 法 与 可 处 理 非 独立 效应 量 间 相 关 性 的 Robust 
variance estimation (RVE) 方 法 进行 对 比 (Fisher & Tipton, 2015)， 我 们 使 用 robumeta 工具 包 对 


纳入 该 研究 的 19 篇 文献 、 共 计 97 个 效应 量 进行 二 次 分 析 ， 结 果 表 明 : 语言 类 型 对 道德 判断 


中 功利 性 


倾向 影响 的 主 效应 依旧 显著 , t=4.18, p<0.001， 效 应 量 g 为 0.21，95%CI 为 [0.10， 


0.32]。 该 结果 表明 ,即使 纳入 该 研究 的 文献 存在 多 个 非 独立 的 效应 量 , 但 是 这 些 非 独 立 效应 


量 间 的 相 


关 性 对 总 效应 量 的 影响 是 有 限 ， 最 终 的 结果 依旧 是 稳定 的 。 


4.4 调节 效应 分 析 


对 语 
故事 类 型 
语系 类 型 

故事 
< 


著 预 测 (5 = 0.003, 95%CI A[-0.002, 0.007]; z=1.06, 万 = 0.289)。 贝 叶 斯 回归 分 析 的 结果 显 


言 类 型 影响 道德 判断 中 功利 性 倾向 的 随机 效应 模型 进行 调节 效应 分 析 。 结 果 表 明 ， 
可 调节 道德 外 语 效应 ; 记分 方式 在 非 个 人 道德 两 难 故事 中 的 调节 效应 显著 ; 性 别 和 
的 调节 效应 均 不 显著 。 

类 


类 型 能 显著 调节 道德 外 语 效应 ， 亚 组 分 析 结 果 显 著 ，O 值 (组 间 ) 为 10.96, p=0.004 


0.05; 在 个 人 道德 两 难 故事 中 获得 了 较 小 但 稳定 的 效应 值 (g=0.32), 但 在 日 常 道德 评价 故 


性 别 


示 ， 贝 叶 


据 认 为 道德 外 语 效应 不 存在 性 别 差 异 。 根据 上 述 分 析 , 仅 有 个 人 道德 两 难 故 事 存 在 稳定 的 道 


德 外 语 效应 ， 为 此 可 进一步 探究 ， 性 另 


i 


FNE 


的 研究 数 


事 (g=0.12) 与 非 个 人 道德 两 难 故事 中 (g = 0.11) 不 存在 道德 外 语 效应 。 


的 调节 作用 不 显著 。 元 回归 分 析 表 明 , 女性 比例 不 能 对 道德 外 语 效应 的 大 小 进行 显 


斯 因子 BF 为 0.30， 根 据 判 定 标准 (Wagenmakers et al., 2017)， 存 在 中 等 程度 的 证 


| 能 和 否 调节 个 人 道德 两 难 故 事 中 的 外 语 效应 。 根 据 以 往 
议 ， 纳 入 元 回归 分 析 的 研究 不 得 少 于 6 项 (Fu et al., 2011)， 使 用 个 人 道德 两 难 故事 
目 大 于 6 项 ， 所 以 该 故事 类 型 下 的 研究 可 进行 元 回归 分 析 。 结 果 表 明 : 在 使 用 个 人 


道德 两 难 故事 的 研究 中 ， 元 回归 分 析 (50 项 研究 ) 结 果 不 显 著 (2 = 0.001, 95%CI 为 [-0.005， 


0.007]; z= 0.34, p=0.730). 

记分 方式 的 调节 作用 不 显著 。 亚 组 分 析 结 果 不 显 著 ,O 值 (组 间 ) 为 0.84,p=0.358 > 0.05; 
但 是 其 亚 组 结果 显示 出 利用 多 点 记分 测 得 的 效应 值 (g = 0.27) 是 高 于 二 点 记分 的 效应 值 Ce = 
0.20)。 贝 叶 斯 方差 分 析 的 结果 也 显示 BF io 为 0.24， 说 明 仅 仅 存在 中 等 程度 的 证 据 认 为 道德 
外 语 效应 不 受 记 分 方式 的 调节 。 根 据 上 述 分 析 ， 仅 有 故事 类 型 能 显赫 调节 道德 外 语 效应 ， 为 
避免 故事 类 型 对 结果 的 混淆 , 我 们 进一步 探究 了 在 不 同 故事 类 型 中 , 记分 方式 的 调节 效应 是 
否 显 著 。 结 果 表 明 : 在 使 用 个 人 道德 两 难 故事 的 研究 中 ， 亚 组 分 析 (50 项 研究 ) 结 果 不 显著 ， 
O 值 (组 间 ) 为 0.65, p=0.421>0.05, 多 点 记分 效应 值 g 为 0.38， 二 点 记分 效应 值 g 为 0.29， 
均 为 较 小 但 稳定 的 效应 值 ; 在 使 用 非 个 人 道德 两 难 故事 的 研究 中 , 亚 组 分 析 (33 项 研究 ) 结 果 
显著 ，O 值 (组 间 ) 为 8.97，P = 0.003 < 0.05， 多 点 记分 效应 值 g 为 0.27， 存 在 较 小 但 稳定 的 
效应 ， 二 点 记分 效应 值 g 为 0.05， 不 存在 效应 ; 使 用 日 常 道德 评价 故事 的 研究 均 为 多 点 记 
分 ,无 法 进行 亚 组 分 析 。 根 据 以 往 研究 的 建议 ， 亚 组 分 析 每 组 纳入 的 研究 应 不 少 于 4 项 (Fu 
et al., 2011)， 上 述 亚 组 分 析 结 果 符 合 该 前 提 。 


= 语系 类 型 的 调节 作用 不 显著 。 亚 组 分 析 结 果 不 显著 ,9 值 (组 间 ) 为 0.03,P=0.874> 0.05; 


© 同一 语系 效应 值 g 为 0.23， 不 同 语系 效应 值 g 为 0.21。 贝 时 斯 方差 分 析 的 结果 也 显示 BF io 
= 为 0.28， 说 明 存在 中 等 的 证 据 认为 道德 外 语 效应 不 受 记分 方式 的 调节 。 根 据 上 述 分 析 可 知 ， 


依旧 仅 有 故事 类 型 能 显著 调节 道德 外 语 效应 , 为 避免 故事 类 型 对 结果 的 混淆 ,可 进一步 探究 
在 不 同 故 事 类 型 中 , 语系 类 型 的 调节 效应 是 否 显 著 。 结 果 表明 ,在 使 用 任意 一 种 故事 类 型 的 
研究 中 ， 亚 组 分 析 结 果 均 不 显著 : 个 人 道德 两 难 故事 (49 项 研究 )，QO 值 (组 间 ) 为 0.06, p= 
0.815 > 0.05， 同 一 语系 效应 值 g 为 0.32， 效 应 量 较 小 但 显著 ,不 同 语系 效应 值 g 为 0.38， 效 
应 值 不 显著 ; 非 个 人 道德 两 难 故事 (33 项 研究 )，2 值 (组 间 ) 为 0.27，P = 0.604 > 0.05， 同 一 
语系 效应 值 g 为 0.11， 不 同 语系 效应 值 g 为 0.16， 均 不 存在 效应 ;日 常 道德 评价 故事 (13 项 
究 )，O 值 (组 间 ) 为 2.40，p = 0.121 > 0.05， 同 一 语系 效应 值 g 为 0.19， 不 同 语系 效应 值 g 
为 - 0.09， 均 不 存在 效应 。 根 据 以 往 研 究 的 建议 ， 亚 组 分 析 每 组 纳入 的 研究 应 不 少 于 4 项 (Fu 
et al.,2011)， 上 述 亚 组 分 析 结果 符合 该 前 提 。 亚 组 分 析 结果 详 见 表 2; 贝 叶 斯 分 析 详 见 表 3; 
不 同 故事 类 型 下 ， 记 分 方式 和 语系 类 型 的 亚 组 分 析 结 果 详 见 表 4。 
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表 2 道德 外 语 效应 的 调节 效应 检验 


调节 变量 异 质 性 检验 类 别 K 95%CI 双 尾 检验 


Oz df p 点 估计 下 限 ERR Z p 
个 人 道德 两 难 故 事 50 0.318 0.224 0.413 6.592 0.000 
故事 类 型 ”10.956 2 0.004 日 常 道德 评价 故事 13 0.124 -0.034 0.281 1.536 0.125 
非 个 人 道德 两 难 故事 33 0.113 0.029 0.197 2.645 0.008 
二 点 记分 61 0.202 0.118 0.286 4.726 0.000 
记分 方式 0.790 1 0.373 
多 点 记分 36 0.266 0.159 0.373 4.872 0.000 
同一 语系 79 0.228 0.160 0.295 6.624 0.000 
语系 类 型 0.030 1 0.874 
不 同 语系 17 0.208 -0.028 0.443 1.731 0.083 
YE: 0 代表 异 质 性 检验 结果 ; KK 代表 独立 效果 量 的 个 数 ，95%CI 为 亚 组 效果 量 g 的 95% 置 信 区 间 。 
表 3 贝 叶 斯 分 析 结 果 
Models P(M) P(M(data) BFu Brio %error 
B Null model 0.500 0.771 3.376 1.000 
回归 分 析 
性 别 0.500 0.229 0.296 0.296 0.008 
Null model 0.200 0.622 6.577 1.000 
#4 E 
AEAN 记分 方式 0.200 0.149 0.700 0.240 0.034 
语系 类 型 0.200 0.174 0.843 0.280 0.008 
表 4 不 同 故事 类 型 下 ， 记 分 方式 与 语系 类 型 的 调节 效应 检验 
异 质 性 检验 95%CI 双 尾 检验 
调节 变量 故事 类 型 类 别 K 
Op df p 点 估计 下 限 ERR Z p 
个 人 道德 点 记分 35 0.293 0.182 0.404 5.168 0.000 
ey 0.646 1 0.421 
两 难 改 事 多 点 记分 15 0.381 0.196 0.566 4.040 0.000 
记分 方式 
非 个 人 道德 二 点 记分 25 0.054 -0.042 0.149 1.104 0.270 
aon 8.967 1 0.003 
两 难 改 事 多 点 记分 8 0.272 0.166 0.378 5.026 0.000 
个 人 道德 同一 语系 ”41 0.316 0.229 0.404 7.053 0.000 
teas 0.060 1 0.802 
两 难 故 事 不 同 语系 8 0375 -0.108 0.859 1521 0.128 
非 个 人 道德 同一 语系 29 0.106 0.011 0.201 2.175 0.030 
语系 类 型 0268 1 0.604 
两 难 故 事 不 同 语系 4 0.157 -0.012 0.326 1.822 0.068 
日 常 道德 同一 语系 9 0.188 -0.003 0.380 1.925 0.054 
2.404 1 0.121 
评价 故事 不 同 语系 4 -0.087 -0.378 0.204 -0.587 0.557 
VE: 0 代表 异 质 性 检验 结果 ; K 代表 独立 效果 量 的 个 数 ; 95%CI 为 亚 组 效果 量 g 的 95% 置 信 区 间 。 


5 讨论 

本 研究 利用 元 分 析 方 法 获得 以 下 结果 : (1) 道 德 外 语 效应 具有 稳定 但 较 小 的 效应 量 ，(2) 
故事 类 型 对 该 效应 的 调节 作用 显著 ，(3) 记 分 方式 仅 在 非 个 人 道德 两 难 故事 中 存在 显著 的 调 
节 作用 ; (4) 性 别 和 语系 类 型 的 调节 作用 均 不 显著 。 
5.1 语言 类 型 对 道德 判断 中 功利 性 倾向 的 主 效应 

本 研究 将 外 语 效 应 于 2012 年 发 现 以 来 有 关 道 德 判断 领域 的 19 篇 文献 、 共 计 41 项 研究 
进行 了 元 分 析 , 将 语言 类 型 对 道德 判断 中 功利 性 倾向 的 影响 程度 进行 了 分 析 与 探索 , 结果 发 
现 外 语 的 使 用 对 道德 判断 存在 较 小 但 是 稳定 的 效应 量 , 即 当 个 体 使 用 外 语 而 非 母 语 进 行道 德 
决策 时 ， 更 有 可 能 做 出 功利 性 选择 。 该 结果 与 前 人 的 研究 是 一 致 (Cipolletti et al., 2016; Corey 
et al., 2017; Costa et al., 2014; Geipel et al., 2015Sb)， 也 对 本 研究 的 假设 1 进行 了 验证 。 

该 研究 发 现 ， 语 言 类 型 对 道德 判断 中 功利 性 倾向 的 影响 (道德 外 语 效应 ) 是 稳定 的 ， 这 说 
明 外 语 相 较 于 母语 确实 在 一 定 程度 上 会 改变 个 体 的 道德 决策 倾向 前文 论 述 的 “ 双 加 工 理论 ” 
的 两 类 机 制 其 实 并 非 相互 对 立 , 更 多 是 显示 个 体 阅 读 外 语 时 的 某 种 加 工 倾向 , 导致 道德 判断 
偏向 于 功利 性 的 决策 结果 , 而 双语 导致 的 情绪 反应 差异 在 以 上 两 条 加 工 路 径 中 均 起 着 重要 作 
j 。 分 析 式 加 工 理论 认为 ， 外 语 情 境 下 认 知 资源 的 调动 与 认 知 负 担 的 增加 降低 了 个 体 情 绪 唤 
醒 强 度 ， 进 而 对 信息 处 理 更 加 审慎 与 理性 (Costa et al., 2014); 反之 ， 母 语 情境 下 ， 以 耗费 少 
量 资源 的 自动 化 加 工 为 主 , 更 容易 唤起 个 体 情绪 ,而 道德 判断 中 功利 性 倾向 与 认 知 需求 相关 ， 
义 性 倾向 则 与 情绪 及 共 情 有 关 (Conway & Gawronski, 2013)。 直 觉 式 加 工 理论 主张 ， 母 语 
情境 下 社会 道德 规范 的 激活 是 依靠 情绪 为 主导 的 直觉 式 加 工 , 但 外 语 情境 弱化 了 这 种 以 情绪 
驱动 为 主 的 启发 式 反应 (Geipel et al., 2015a)， 进 而 减弱 了 对 社会 道德 规范 的 激活 (Chan et al., 
2016; Geipel et al., 2015a; Hadjichristidis et al., 2017)， 从 而 使 个 体 不 易 受 其 约束 。 由 此 可 见 ， 
结合 个 体 在 双语 间 情 绪 反 应 差异 的 证 据 ,“ 双 加 工 理论 ”可 以 对 道德 外 语 效应 的 内 在 机 制 进 
行 一 定 程度 的 解释 。 但 其 中 难以 忽视 的 客观 情况 是 “个 体 在 双语 条 件 下 接受 了 相同 的 道德 情 
境 信息 ， 但 却 做 出 了 不 同 的 判断 ” 这 说 明 提 供给 个 体 的 信息 即使 其 本 质 内 容 是 相同 的 ， 但 
由 于 不 同类 型 的 语言 载体 , 可 能 导致 个 体 在 关注 和 解释 信息 时 存在 差异 , 进而 出 现 不 一 致 的 
判断 。 

我 们 需要 指出 的 是 :“ 双 加 工 理论 ”并 不 能 揭示 信息 以 不 同 语言 为 载体 呈现 时 ， 个 体 在 
其 中 进行 信息 加 工 的 具体 差别 。 而 近年 来 兴起 的 解释 水 平 理 论 则 为 语言 影响 道德 判断 的 研究 
提供 了 新 视角 ( 李 明 晖 ， 饶 债 琳 ,2017)。 解释 水 平 理论 认为 个 体 对 事物 的 信息 表征 可 分 为 高 低 


两 个 解释 水 平 , 高 解释 水 平 的 表征 使 个 体 更 关注 事物 的 核心 特征 和 抽象 性 信息 , 而 低 解 释 水 
平 的 表征 更 强调 事物 的 次 要 特征 和 细节 化 信息 (Trope & Liberman, 2010)。 心 理 距离 是 影响 解 
释 水 平 的 重要 变量 ,代表 个 体 对 某 类 事物 以 此 时 、 此 地 、 自 己 为 参考 点 时 接近 或 远离 产生 的 
一 种 主观 经 验 (Liberman & Trope, 2014); 个 体 与 某 类 事物 的 心理 距离 越 远 则 进行 表征 的 解释 
水 平 越 高 (Aguilar et al., 2013)。 研 究 表明 ， 人 们 在 使 用 外 语 时 对 社会 伦理 的 敏感 性 较 低 ， 伴 
随 着 更 低 水 平 的 情绪 唤醒 (Dewaele, 2010)， 进 而 增加 了 个 体感 知 到 的 心理 距离 ， 由 此 针对 乡 
见 的 信息 更 容易 进行 高 解释 水 平 ， 建 立 更 加 抽象 的 表征 形式 ( 张 诗 容 ， 胡平 , 2017; Amit 
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et al., 2009); 而 母语 的 习 得 与 情绪 信息 丰富 的 社会 场景 密切 相关 ， 使 人 们 更 在 意 道德 规范 与 
社会 评价 ， 更 易 诱 发 相关 情绪 反应 ， 从 而 拉 近 了 个 体 与 相关 事物 的 心理 距离 ， 对 母语 呈现 的 
信息 更 易 构 建 具体 的 、 低 解释 水 平 的 表征 (Gong & Medin, 2012; Pavlenko,2012)。 此 外 ， 另 有 
究 指出 ， 当 个 体 对 道德 判断 进行 高 解释 水 平 的 抽象 性 表征 时 ， 更 关注 行为 的 结果 ， 倾 向 于 
做 出 功利 论 的 选择 (Gong & Medin, 2012); 而 对 相关 信息 进行 低 解释 水 平 的 具体 化 表征 时 ， 
个 体 更 关注 行为 是 否 符合 道德 准则 ， 进 而 倾向 于 道义 论 的 判断 (Aguilar et al., 2013)。 由 此 推 
论 ， 相同 的 道德 情境 用 外 语 呈 现时 , 个 体 可 能 更 倾向 于 对 其 进行 高 解释 水 平 的 表征 ， 进 而 更 
易 出 现 功 利 论 的 判断 ;反之 , 相关 信息 以 母语 为 载体 时 , 由 于 低 解 释 水 平 表征 的 可 能 性 更 大 ， 
道德 判断 倾向 于 道义 论 的 结果 。 因此, 未 来 对 道德 判断 中 外 语 效应 的 进一步 探索 可 能 需要 聚 
焦 于 双语 语 境 与 解释 水 平 间 的 关系 及 作用 机 制 。 
需要 提 及 的 是 ,本 研究 虽然 聚焦 于 道德 判断 领域 中 的 外 语 效应 ， 且 该 效应 在 道德 判断 和 
风险 决策 领域 的 表现 形式 存在 差异 , 但 两 者 的 内 在 机 制 也 可 能 有 相似 之 处 .从 最 终结 果 来 看 ， 
PT 风险 决策 情境 以 外 语 呈 现时 ， 经 典 的 决策 偏差 被 削弱 或 消失 ， 更 符合 理性 加 工 的 结果 ( 张 诗 
容 ， 胡平, 2017)， 而 在 外 语 语 境 的 道德 判断 中 ， 个 体 所 表现 的 功利 性 倾向 暗示 其 决策 时 的 加 
工 过 程 更 具 理性 思维 ( 关 旭 等 , 2017)。 从 两 类 决策 包含 的 心理 机 制 来 看 ， 道 德 判断 是 涉及 认 
知 控制 、 规 则 表征 、 情 绪 与 推理 、 成 本 与 收益 评估 等 机 制 相互 作用 的 复杂 加 工 过 程 ( 李 笑 燃 
等 ,2014)， 而 上 述 机 制 与 风险 决策 密切 相关 (黄龙 等 ,2020)。 此 外 ,个 体 在 进行 道德 判断 时 激 
活 的 神经 网 络 与 风险 决策 时 调用 的 神经 网 络 也 有 相似 之 处 ( 罗 跃 嘉 等 , 2013)。 这 说 明 风 险 决 
策 和 道德 判断 虽然 任务 表现 形式 不 同 , 但 其 内 部 加 工 过 程 有 类 似 之 处 ; 而 外 语 语 境 对 道德 判 
断 和 风险 决策 的 影响 , 即 外 语 效应 的 存在 ， 可 能 与 两 种 任务 中 情绪 唤醒 的 程度 有 关 (Geipelet 
al., 2015a)。 相 较 于 母语 ， 外 语 对 情绪 唤醒 的 弱化 及 其 离 身 性 导致 个 体 更 倾向 于 分 析 式 加 工 
而 非 启 发 式 加 工 (Costa et al., 2014, Geipel et al., 2016)。 由 于 双语 习 得 环境 的 差异 ， 外 语 更 具 
语义 性 信息 而 非 情绪 性 信息 (Pavlenko, 2004)， 相 同 的 决策 场景 通过 双语 表征 后 ， 其 情绪 性 信 
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AMEK FFER, BEM SEE A HC tat A AR (Shin & Kim, 2017). FAC, 个 体 在 
外 语 语 境 下 存在 更 多 的 理性 决策 行为 或 更 加 功利 性 的 道德 判断 。 

该 研究 还 发 现 , 外 语 对 道德 判断 中 功利 性 倾向 的 影响 虽然 稳定 ,但 却 属于 较 小 的 效应 量 
这 表明 语言 是 造成 道德 决策 差异 的 重要 因素 而 非 决定 性 因素 。 这 种 选择 倾向 不 仅 受 到 语言 条 
件 的 影响 ,还 有 其 它 因素 会 导致 道德 判断 中 的 决策 差异 : 如 外 语 的 文化 影响 力 、 母 语 与 外 语 


间 的 语言 相似 性 会 影响 最 终 的 决策 结果 (Dylman & Champoux-Larsson, 2020); 实验 材料 选用 


的 故事 类 型 也 会 影响 外 语 效应 的 出 现 (Corey et al., 2017; Geipel et al., 2015a; Shin & Kim, 2017); 
记分 方式 的 不 同 使 得 同一 批 被 试 的 实验 结果 其 最 终 获 得 的 效应 值 相差 较 大 (Geipel et al., 
2015a)。 以 上 结果 说 明 ， 尽 管 语言 能 对 道德 判断 的 结果 产生 某 种 倾向 性 的 影响 ,但 总 体 上 看 
其 影响 程度 依旧 是 有 限 的 ， 远 未 达到 预测 个 体 决 策 结果 的 程度 ， 因 此 ， 既 要 重视 语言 对 于 道 
德 判断 的 作用 ， 也 不 可 过 分 夸大 语言 对 决策 结果 的 直接 影响 。 该 元 分 析 结 果 也 暗示 了 ， 需 要 
利用 调节 效应 分 析 进 一 步 探索 影响 道德 判断 中 外 语 效应 出 现 边界 的 重要 因素 。 


5.2 语言 类 型 对 道德 判断 中 功利 性 倾向 的 调节 效应 

5.2.1 故事 类 型 的 调节 效应 

亚 组 分 析 结 果 显示 , 故事 类 型 的 调节 效应 显著 , 在 个 人 道德 两 难 故 事 中 存在 较 小 但 稳定 
的 道德 外 语 效应 , 但 非 个 人 道德 两 难 故事 与 在 日 常 道 德 评价 故事 不 存在 道德 外 语 效应 。 这 表 
明 故 事 类 型 会 导致 实验 结果 出 现 差 异 ， 支 持 了 假设 3。 采 用 不 同 的 故事 类 型 而 出 现 的 结果 差 
= 异 可 能 与 被 试 面 对 道德 情境 的 自我 卷 入 程度 有 关 。 个 人 道德 两 难 故 事 存在 稳定 的 效应 , 可 能 


是 由 于 这 样 情境 用 母语 呈现 时 让 被 试 的 自我 卷 入 程度 更 高 , 从 而 会 引发 更 多 的 负 性 情绪 与 冲 
突 情感 ( 张 诗 容 , 胡平 ,2017)。 因 此 ， 被 试 以 决策 者 的 身份 进行 选择 时 ， 会 拉 近 与 受害 者 的 情 
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感 距离 ， 从 而 更 倾向 于 做 出 道义 性 选择 ; 而 当 该 高 情感 冲突 的 情境 用 外 语 呈 现时 ， 由 于 外 语 
对 情绪 的 弱化 作用 ， 降 低 了 被 试 的 情绪 反应 ， 从 而 更 倾向 于 功利 性 的 选择 。 非 个 人 道德 两 难 
故事 与 日 常 道德 评价 故事 不 存在 效应 , 依旧 与 其 诱发 的 道德 情境 的 自我 卷 入 程度 有 关 。 ET 
人 道德 两 难 故事 的 情境 具有 较 低 的 自我 卷 入 程度 , 被 试 在 理解 故事 的 基础 上 , 不 会 因为 语言 
的 不 同 而 产生 情绪 反应 的 差异 , 进而 影响 决策 结果 。 且 非 个 人 道德 两 难 故事 获得 的 效应 值 大 
小 处 于 无 效应 的 范围 内 且 结果 不 显著 ,这 表明 ,， 相 较 于 个 人 道德 两 难 故事 其 难以 存在 稳定 的 
外 语 效应 ， 这 与 以 往 的 研究 一 致 (Geipel et al., 2015b; Hadjichristidis et al., 2017; Hayakawa et 
al.,2017)。 在 日 常 道 德 评价 故事 中 也 未 发 现 道德 外 语 效应 ， 这 是 由 于 该 类 型 的 故事 昌 有 具有 
定 的 真实 性 ,但 依旧 不 存在 高 情感 冲突 的 情境 ， 自 我 卷 入 程度 不 及 个 人 道德 两 难 故事 。 而 使 


日 常 道德 评价 故事 的 研究 中 ， 仅 有 一 半 故 事 存 在 外 语 效应 (Geipel et al., 2015b)， 这 说明 该 
类 型 故事 诱发 的 自我 卷 入 程度 也 不 尽 相 同 。 这 一 结果 提示 未 来 在 确定 道德 判断 的 实验 材料 
时 ， 需 要 联系 研究 的 具体 目的 进一步 考虑 故事 诱发 的 自我 卷 入 程度 。 

5.2.2 性 别 的 调节 效应 

9 分析 结果 显示 , 性 别 的 调节 效应 不 显著 ， 贝 叶 斯 回归 分 析 也 表明 有 中 等 程度 的 证 
据 认 为 两 者 间 的 关系 不 受 性 别 的 影响 。 因 此 ， 该 结果 未 能 支持 假设 2， 表 明道 德 外 语 效应 可 
能 存在 跨 性 别 的 稳定 性 。 虽然 已 有 元 分 析 的 结果 表明 , 对 于 道德 困境 问题 的 决策 存在 着 性 别 
差异 ， 即 相 较 于 男性 ， 女 性 更 倾向 于 做 出 道义 性 选择 (Friesdorf et al., 2015)， 这 可 能 是 由 于 女 
性 更 容易 唤起 更 强烈 的 负 性 情绪 ， 具 有 更 高 的 共 情 水 平 ， 而 道义 性 倾向 于 共 情 有 关 (Conway 
& Gawronski, 2013)， 这 在 一 定 程度 上 会 使 得 女性 更 愿意 做 出 道义 性 的 选择 。 但 是 ， 本 研究 


发 现在 外 语 条 件 下 道德 决策 的 结果 不 存在 性 别 差 异 。 这 可 能 是 因为 , 即使 女性 面 对 母 语 呈 现 
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ne 的 道德 困境 更 容易 唤醒 更 强烈 的 负面 情绪 , 但 是 面 对 外 语 呈 现 的 道德 困境 时 ， 外 语 对 被 试 情 
= 绪 反 应 的 弱化 作用 (Dewaele, 2004; Pavlenko, 2004)， 导 致 负 性 情绪 的 唤醒 水 平 在 性 别 间 的 差 
N 异 并 不 显著 。 这 造成 不 同性 别 群体 在 外 语 条 件 下 面 对 相同 道德 两 难 困境 时 具有 相似 水 平 的 情 
= 绪 状 态 ， 其 道德 两 难 德 困 境 的 决策 结果 便 不 一 定 存 在 性 别 差 异 。 另 外 ， 贝 叶 斯 分 析 表 明 仅 有 
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中 等 程度 的 证 据 支 持 不 存在 性 别 差 异 ， 未 来 可 以 进一步 验证 该 结论 的 稳定 性 。 
5.2.3 记分 方式 的 调节 效应 
亚 组 分 析 还 发 现 ， 记 分 方式 的 调节 效应 不 显著 。 我 们 基于 文献 梳理 发 现 ， 被 试 进行 道德 
(== 判断 的 方式 有 两 大 类 ， 二 点 记分 与 多 点 记分 。 亚 组 分 析 结 果 表 明 ， 多 点 记分 获得 的 语言 类 型 
FT 对 道德 判断 中 功利 性 倾向 的 效应 值 要 高 于 二 点 记分 的 效应 值 , 但 是 两 组 间 的 组 间 差 异 并 不 显 
著 ， 未 能 支持 假设 4， 但 是 却 在 一 定 程度 上 反映 了 假设 4 的 基本 趋势 ， 即 多 点 记分 相 较 于 二 
点 记分 更 加 敏感 。 贝 叶 斯 方差 分 析 的 结果 也 显示 , 仅 有 中 等 程度 的 证 据 认为 道德 外 语 效应 不 
受 记分 方式 的 调节 。 因 此 ， 两 者 间 的 关系 是 否 不 受 记分 方式 的 影响 还 需 进一步 的 分 析 验 证 。 
出 现 该 结果 的 原因 可 能 在 于 , 直接 针对 记分 方式 的 亚 组 分 析 并 未 将 故事 类 型 这 一 因素 进行 
ay; 具有 高 自我 卷 入 度 的 故事 更 容易 观察 到 外 语 效应 (Corey et al., 2017; Shin & Kim, 2017) 而 
不 受 记分 方式 的 影响 (Geipel et al., 2015a)， 而 自我 卷 入 度 较 低 的 故事 可 能 需要 依靠 更 加 敏感 
的 记分 方式 才能 观察 到 外 语 效应 。 因 此 ， 在 对 采用 的 故事 类 型 进行 区 分 后 ,我 们 发 现 ， 在 非 
个 人 道德 两 难 故 事 中 发 现 了 记分 方式 的 调节 效应 , 而 在 个 人 道德 两 难 故 事 中 记分 方式 的 调节 
效应 则 不 显著 。 因 此 , 在 未 来 的 研究 成 果 更 加 丰富 后 可 以 进一步 验证 不 同 故事 类 型 下 ， 道 德 
外 语 效应 是 否 受到 记分 方式 的 调节 。 
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5.2.4 语系 类 型 的 调节 效应 

亚 组 分 析 同 样 发 现 , 语系 类 型 的 调节 效应 不 显著 , 不 同 故 事 类 型 下 也 未 发 现 语系 类 型 的 
调节 作用 。 我 们 根据 文献 提供 的 母语 与 外 语 的 信息 , 将 所 有 的 研究 分 为 : 母语 与 外 语 属于 同 
一 语系 或 不 同 语系 。 亚 组 分 析 结 果 表 明 ， 组 间 差异 不 显著 ， 未 能 支持 假设 5S。 贝 叶 斯 方差 分 
析 的 结果 显示 , 存在 中 等 程度 的 证 据 认 为 道德 外 语 效应 不 受 语系 类 型 的 影响 。 出 现 该 结果 的 
原因 可 能 在 于 , 本 次 亚 组 分 析 有 关 不 同 语系 的 研究 仅 有 17 项 , 且 这 17 项 研究 间 本 身 就 具有 
很 高 的 异 质 性 。 已 有 研究 表明 ， 和 母语 与 外 语 间 的 相似 性 会 对 外 语 效应 产生 影响 , 语言 相似 的 
外 语 可 以 激活 母语 的 一 般 结构 , 从 而 在 用 外 语 阅读 道德 困境 时 会 激活 体验 水 平 较为 一 致 的 情 
感 共鸣 (Dylman & Champoux-Larsson, 2020)。 这 可 能 通过 语言 间 共 享 的 语言 结构 、 共 享 的 语 
法 、 同 源 词 的 数量 等 来 实现 .即使 个 体 的 外 语 水 平 较 低 , 但 是 母语 与 外 语 具 有 较 高 的 相似 性 ， 
其 在 用 外 语 阅读 道德 困境 时 , 可 能 已 经 策略 性 地 将 外 语 锚 定 在 他 们 母语 的 情感 上 (Colome & 


Miozzo, 2010; Dylman & Barry, 2018; Green, 2009)。 因 此 ， 我 们 推论 属于 同一 语系 的 语言 间 可 
能 更 不 容易 观察 到 外 语 效应 , 而 不 同 语系 的 语言 间 由 于 策略 性 的 迁移 过 程 难以 实现 可 能 更 容 
易 观 察 到 外 语 效 应 , 语系 类 型 可 能 存在 差异 。 由 于 相关 的 研究 较 少 ,可 待 拥有 更 丰富 的 研究 
成 果 后 继续 探究 道德 外 语 效应 是 否 受 到 语系 类 型 的 调节 。 

综 上 , 本 研究 首次 利用 元 分 析 方法 系统 探究 了 外 语 效应 在 道德 判断 领域 中 的 稳健 性 及 影 
响 因素 ， 回答 了 研究 者 对 道德 外 语 效应 稳定 性 的 争议 , 发 现 了 故事 类 型 的 调节 作用 ,揭示 了 
记分 方式 对 效应 值 大 小 的 潜在 影响 , 对 未 来 的 实证 研究 在 实验 材料 和 统计 方式 的 最 终 选 择 上 
有 具有 一 定 的 启示 和 指导 意义 。 
53 研究 不 足 与 展望 

首先 , 元 分 析 需 要 竭尽 周全 的 纳入 已 有 的 研究 成 果 , 该 研究 虽 利 用 检索 工具 尽 可 能 的 对 
文献 进行 了 搜集 整理 ， 但 一 些 未 发 表 的 文献 依旧 难以 搜集 ， 存 在 数据 遗留 的 问题 。 其 次 ， 外 
语 效 应 的 影响 因素 较 多 , 但 在 本 研究 中 仅仅 考虑 了 性 别 、 故 事 类 型 、 记 分 方式 和 语系 类 型 这 
4 个 因素 ， 还 有 一 些 影 响 因 素 未 被 涉及 到 ， 如 双语 者 外 语 的 熟练 程度 越 低 ， 越 容易 观察 到 外 
语 效 应 (Conrad et al., 2011; Degner et al., 2012); 由 于 本 研究 纳入 的 文献 接近 半数 在 实验 中 未 
搜集 相关 信息 ， 数 据 量 不 足 ， 因 此 未 放 入 分 析 。 最 后 ， 尽 管 本 研究 验证 了 同 篇 文献 下 各 个 非 
独立 效应 量 间 的 相关 对 最 终结 果 的 影响 有 限 , 但 一 篇 文献 纳入 多 个 效应 量 的 情况 在 本 研究 中 
不 可 避免 ,将 来 的 研究 可 以 尝试 建立 元 分 析 的 三 级 整合 模型 , 进一步 区 分 研究 内 误差 与 研究 
间 误 差 (Assink & Wibbelink, 2016)。 未 来 研究 应 在 更 系统 全 面 的 搜集 文献 后 ， 进 一 步 拓 展 可 
调节 道德 外 语 效应 的 重要 变量 ， 并 构建 更 加 准确 的 数据 分 析 模 型 来 佐证 研究 假设 。 
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6 结论 

本 研究 通过 元 分 析 方法 得 出 如 下 结论 (1) 语言 类 型 对 道德 判断 中 的 功利 性 倾向 存 
在 稳定 但 有 限 的 影响 ; (2) 故 事 类 型 的 调节 作用 显著 , 仅 在 个 人 道德 两 难 故事 中 存在 较 小 
但 稳定 的 效应 ;记分 方式 仅 在 非 个 人 道德 两 难 故事 中 的 调节 作用 显著 ， 只 有 多 点 记分 存 
在 较 小 但 稳定 的 效应 :性别 和 语系 类 型 的 调节 作用 均 不 显著 。 
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Moral foreign language effect and its moderating variables: a systematic 


review and meta-analysis 
ZHU Lin!, LIU Jinrul LI Jing!, LIU Conghui! 
( Department of Psychology, Renmin University of China, Beijing 100872, China) 
Abstract: When presented with the moral decision-making situation within a foreign language 
context, the individuals will show a stronger utilitarian moral evaluation tendency compared with 
the same situation within the native language context. This phenomenon is defined as the moral 
foreign language effect. Numerous research studies have explored how the language context can 
influence moral judgment. However, the results were far from consistent. In this work, we used 
meta-analysis to explore the effect of the language type (native language vs. foreign language) on 
the individuals’ utilitarian tendency in moral judgments, and we analyzed several moderating 
variables. We retrieved 19 papers from the literature, with 46 independent samples, 97 effect sizes 
and 9672 participants that met the inclusion criteria. The results demonstrated a small but stable 
moral foreign language effect (g = 0.23). Analyzing the moderation factors indicated that the moral 
foreign language effect was influenced by the story type, with a small but stable effect for personal 
moral dilemma stories (g = 0.32). On the other hand, there was no foreign language effect for 
impersonal moral dilemma stories (g = 0.11) or daily moral evaluation stories (g = 0.12). In addition, 
the foreign language effect for impersonal moral dilemma stories was affected by the scoring 
method. There was a significant effect under multi-point scoring (g = 0.27), but not under two-point 
scoring (g = 0.05). As for the sex and language family type, no significant moderating effect was 
observed. Our results suggest that the language type has a certain impact on the individuals' decision 
tendency when faced with moral dilemmas. More attention should be paid to the influence of the 


moral dilemma story type and a scoring method in future research. 
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